iT邦幫忙

2023 iThome 鐵人賽

DAY 14
0
自我挑戰組

我與熊貓Pandas相處的日子系列 第 14

Day14- 資料探索(7)布林索引

  • 分享至 

  • xImage
  •  

布林索引又稱布林選取,就是使用布林陣列來篩選資料的方法。

先對DataFrame的其中一個欄位進行條件判斷,進而得到一個布林陣列,再從中計算摘要統計資訊。

先匯入資料

import pandas as pd
fruit={'蘋果':{'小明':8,'小美':3,'小英':4,'小玉':2,'小翔':6,'小意':7,'小平':9,'小亮':10},'香蕉':{'小明':4,'小美':6,'小英':8,'小玉':9,'小翔':2,'小意':4,'小平':6,'小亮':5}}
fruit1=pd.DataFrame(fruit)
print(fruit1)

執行結果:
    蘋果  香蕉
小明   8   4
小美   3   6
小英   4   8
小玉   2   9
小翔   6   2
小意   7   4
小平   9   6
小亮  10   5

想知道對蘋果喜好程度大於6的有那些成員,利用運算篩號進行篩選後,傳回一個布林陣列。

fruit2=df1['蘋果']>6
print(fruit2)

執行結果:
小明     True
小美    False
小英    False
小玉    False
小翔    False
小意     True
小平     True
小亮     True
Name: 蘋果, dtype: bool

由於布林陣列中的True及False分別對應到1和0,因此可以用sum()算出超過喜好度超過6的成員總數。

fruit2.sum()

執行結果:
4

使用mean()再乘上100,可算出喜好度超過6成員的百分比。

fruit2.mean()*100

執行結果:
50.0

將describe()套用在布林陣列上,進行輸出統計資訊摘要。

fruit2.describe()

執行結果:
count        8
unique       2
top       True
freq         4
Name: 蘋果, dtype: object

學會進一步使用布林值了,吃完月餅,明天再來繼續吧~ /images/emoticon/emoticon71.gif


上一篇
Day13- 資料探索(6)資料重整
下一篇
Day15- 資料探索(8)統計方法
系列文
我與熊貓Pandas相處的日子30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言